5 分钟就能完成真人程序员一天的工作量。
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
Week 37 · Scaling 范式变了?Self-Play 还值得 All In 吗?
09.13本周,OpenAI 发布新模型 o1 引起热议;DeepSeek 提出万卡计算集群架构 Fire-Flyer 2 。
Week 36 · 用 Test Time 换 Training Time 能让 LLM 更强吗?
09.06本周,李飞飞团队发布空间之能新成果 ReKep;Ilya Sutskever 创企 SSI 完成 10 亿美元融资。
Week 35 · Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在哪?
08.30本周,Meta 提出结合Transformer 与扩散模型的多模态训练方法 Transfusion;外媒称 OpenAI 正在进行 10 亿美元的新一轮融资。
Week 34 · 模型成本疾速上升/下降,哪些技术让训 AI 更省钱?
08.24本周,三人团队开发的学术搜索引擎 Lumina 表现优于谷歌引起热议;星尘智能、智元机器人和宇树分别发布新版机器人产品。
Week 33 · Machine Psychology,解构LLM还是心理学更靠谱吗?
08.16本周,马斯克的 xAI 发布了 Grok-2;AI 程序员 Genie 超越 Devin 引起热议。
Week 32 · 都在这里了,Figure 视频里都藏了啥?
08.09本周,Figure 发布第二代人形机器人;谷歌收购Character AI团队;OpenAI 出现大量人事变动。
Scaling 范式变了?Self-Play 还值得 All In 吗?
09.13OpenAI 训练 o1 模型的方法隐隐指出 Scaling Law 的范式正在转向推理,且这种 Scaling 形式与预训练有很大不同。这一说辞和「草莓」火热期间所引发的 Scaling 范式转向 self-play RL 的讨论既有交叉,也有差异。
你的赛博朋友上线!更易变现、门槛更低的 AI 情感陪伴类应用好用在哪?
09.13AI 情感陪伴类应用增长迅速,踩中了人们的哪些需求?
Businessinsider 最新评选:2024 年 44 家最有前途的 AI 创企
09.13Businessinsider 邀请了 Madrona 的 S.Somasegar、Basis Set Ventures 的 Lan Xuezhao 等数位顶级投资人评选出了 2024 年 44 家最有前途的 AI 创企。
用 Test Time 换 Training Time 能让 LLM 更强吗?
09.06近期基于强化学习改善 LLM 性能的尝试带来了一种新的思路,相比增加模型参数,将 FLOPs 预算投入 Inference-Time-Compute 似乎也能让 LLM 变得更强。
最专业的法律 AI 应用准确率最高也只能到 65%?哪些场景下的法律 AI 是靠谱的?
09.06斯坦福、耶鲁等机构发表研究称,经过实验测试,LexisNexis、GPT-4 等用于法律领域的 AI 工具准确率最高仅到 65%,幻觉问题是需要关注的重要问题。
风投家 Josh Wolfe 的投资洞察:如何看待 AI 公司的高估值情况?
09.06近日,Lux Capital 的联合创始人兼管理合伙人 Josh Wolfe 在节目「The Logan Bartlett Show」上分享了其对目前 AI 风险资本市场的看法。
5 分钟就能完成真人程序员一天的工作量。
To CoT or not to CoT?
waitlist 挤爆了。
大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。
算力、存储和内存等资源全部互联池化,提供澎湃 AI 算力。
在 9 月发表在《Nature》杂志上的一篇论文中,Grove 团队展示了基于结构的方法在研究牛黄病毒中的作用。
来自清华大学的研究人员提出了一种称为分数去噪(Fractional denoising,Frad)的分子预训练框架,以学习有效的分子表示。
安谋科技正式推出本土自研的首款“玲珑”D8/D6/D2显示处理器,以及新一代的“玲珑”V510/V710视频处理器
机器人领军企业普渡机器人正式发布其初代类人形机器人PUDU D7。
「这相当于在理论上,两层神经网络在理论上可以拟合任何数据,我们就盲目相信并应用在所有场景中。」
人工智能领域再度迎来重磅消息!
90后流下了青春的泪水。
最热文章